proj-inclusive 勉強会 1 2022-08-13
前:なし
後:シビックハッカー育成塾.1 2022-10-08
※このページに書き込みたいのに書き込めない場合はこのScrapboxへの参加方法およびScrapboxハンズオンを読んでください
Scrapboxにログインする
https://scrapbox.io/login
このプロジェクトに参加する
https://scrapbox.io/projects/c4j/invitations/858de5b70dd611ce66aad4c4e16795a9
タイムスケジュール
18:00-18:15:(Scrapboxに書き込みできない人のフォロー)趣旨説明、自己紹介
18:15-18:45:①社会分野(志賀信夫『貧困理論入門』第1~3章)
18:45-19:15:②データ分野(Diezほか『データ分析のための統計学入門』第1~2章
http://www.kunitomo-lab.sakura.ne.jp/2021-3-3Open(S).pdf
19:15-19:45:③プログラミング分野(目的に応じたプログラミング:OpenFiscaとは?)
19:45-20:00:休憩
20:00-20:30:特別プログラム「Code for Japan Summit 2022プレゼン検討会」
自己紹介
Koichiro Shiratori.icon:Koichiro Shiratori
研究者、大学教員、専門は行政学
誰一人取り残さない社会を模索中!
yuiseki.icon yuiseki(ゆいせき)
本業はプロジェクトマネージャー、ソフトウェアエンジニアです
大学の専攻は社会学、大学院の専攻は認知科学でした
国連ベクトルタイルツールキットのコントリビューターです
https://github.com/unvt
Nakahara Ousei.iconNakaharaOusei
学生、IT系企業就職希望
作野幹太
学生・大学院進学志望
日本史・語学・社会学・社会保障 を勉強中
将来はUNHCRに入りたい
Ryohei.iconRyohei Sato
グラミン日本Reaserch&Translationチームリーダー
公共政策大学院で社会保障政策の研究をしていました
趣旨説明
勉強会の目的
「だれ一人取り残さない社会の実現をコードで加速する」というproj-inclusiveのミッションの達成に向けて、関わる人の知識を一緒にアップデートし、共通理解をつくっていく。特に「支援制度検索システムの開発」や「貧困関連データの可視化」に役立てる。
方法
オンラインで月1回程度の勉強会を行う。さしあたって、①社会、②データ・統計、③プログラミングの3つの分野を扱う (原則30分程度ずつ)。一方的に特定の講師役から習うのではなく、教材をベースに、知識を持ち寄る演習形式とする。興味のある分野を事前に予習し、Scrapboxなどに要点・疑問点・質問を書いておき、当日は議論を中心に進める。
参加者
だれでも参加可能。お誘いあわせの上ご参加ください。動画は後日Youtubeに公開することを検討中。
①社会分野
志賀信夫(2022)『貧困理論入門-連帯による自由の平等-』
※レジュメ:ryohei.icon作成、Koichiro Shiratori.icon加筆修正
第1章 貧困とは何か-諸概念の整理
0.本書の目的:
「貧困をどのように理解するかの整理」「貧困とは何か」に関する整理を行うこと
※「貧困問題の現状の告発」が目的ではない
1. 「貧困」と周辺概念の整理
貧困の定義:「貧困と非貧困の区別・境界」を言語化したもの
(1)筆者の考える貧困:「あってはならない生活状態」
⇒貧困を議論するのが難しいのは、「あってはならない生活状態」に関する理解が人々で異なっているため
⇒貧困(「あってはならない生活状態」)の概念は人々の要求によって歴史的に拡大してきた
(2)「貧困」の周辺概念
格差:「差があるという事実」
不平等:「あってはならない格差」
階層:何らかの特徴に即して人々を区分し層化したもの
階級:何らかの地位身分の違いを指示する概念
参加者の質問・感想・コメント
貧困の境界が変化する以上「貧困を終わらせる」のは見果てぬ夢か、貧困削減に取り組み続けることこそ重要なのかもKoichiro Shiratori.icon
貧困という概念の社会構成主義?yuiseki.icon
貧困概念の歴史をたどると…公衆衛生、福祉、栄養学など…?
ミシェル・フーコーの生権力にも繋がるかも?yuiseki.icon
人口管理、福祉による統治
貧困概念も肉体や社会に規定されているKoichiro Shiratori.icon
志賀信夫氏の言う階級=マルクス主義的な経済学における社会構造の階級らしいyuiseki.icon
「あってはならない」という主観的側面がある以上、構造的に「貧困」は生じうるRyohei.icon
2. 貧困理論の学説史
第2章 絶対的貧困理論
(1)チャールズ・ブースの貧困調査
https://ja.wikipedia.org/wiki/チャールス%E3%83%BBブース
https://ja.wikipedia.org/wiki/ロンドンの民衆の生活と労働
①19世紀末、イギリスのロンドンで調査を実施
⇒初めて統計的手法に基づき貧困調査を行った
②「資力(所得の多寡)」と「地位(就労形態)」によって人々を八つの階層に区分
⇒「定期的少額所得者」と「定期的標準所得者」の間に「貧困線」を設定
③ブースの貧困理論の特徴
ブースの貧困の定義では、「動物的生存の維持」以上の生活状態が現実的に「あるべき」生活状態として考えられている。
貧困調査の動機はあくまで「産業秩序の維持(資本による統治の方策)」だった
(2)シーボーム・ラウントリーの貧困調査
https://ja.wikipedia.org/wiki/シーボーム%E3%83%BBラウントリー
①イギリスの地方都市ヨークで調査を実施
⇒地方都市においても、大都市と同じくらいの割合の貧困があることを発見
②絶対的貧困:肉体的能率の維持の観点で貧困を定義
参加者の質問・感想・コメント
測ることが対策の第一歩!Koichiro Shiratori.icon
イギリスが発端となっているのが興味深いyuiseki.icon
イギリスが福祉の先端である時代が長いらしいKoichiro Shiratori.icon
https://ja.wikipedia.org/wiki/政治算術
ジョン・グラントの死亡表による政治算術
トマス・ロバート・マルサスの人口論
フランスでは「ライシテ(世俗性)」の問題がまさに論争になっていますよねRyohei.icon
https://ja.wikipedia.org/wiki/ライシテ
フランスにおける政教分離
政教分離と言いつつこれまで宗教が担ってきた役割を国家が担っているのは興味深いyuiseki.icon
第3章 相対的貧困理論
(3)ピーター・タウンゼントによる「相対的剥奪」概念
https://ja.wikipedia.org/wiki/ピーター%E3%83%BBタウンゼント_(社会学者)
①1942年:ベヴァリッジ報告の貧困観:絶対的貧困に基づいている
⇒「男性稼ぎ主モデル」を前提とした社会保障政策とケインジアン型の経済政策により、絶対的貧困数は低減?
⇒1950年代イギリスにおける「貧困消滅論」の噴出
②1960~70年代:「貧困の再発見」
「相対的剥奪」とは、生活する社会で豊かな社会生活を送るために一般的になっている慣習などを行うことができないために社会から締め出されている状態をいう
貧困概念が「肉体的能率を維持できるぎりぎりの生存水準」ではなく、「『社会参加』が可能となるような生活水準」まで拡張される(相対的貧困)
※ただし、ここでいう「社会参加」は、「男性稼ぎ主モデル」等の自身が社会により与えられた役割を遂行するという意味での「社会参加」
⇒タウンゼントの貧困理論は「権利の実質性」に対する考慮は欠落している
タウンゼントの相対的剥奪の12指標
参加者の質問・感想・コメント
現代の「相対的貧困は貧困ではない」という主張を考える上でも重要Koichiro Shiratori.icon
貧困ラインをめぐる争い、われわれはその議論において進歩しているのかKoichiro Shiratori.icon
生活が掘り崩されていく中で、貧困のラインは下がるのか?Koichiro Shiratori.icon
やはり、相対的貧困の線引き(等価可処分所得を順番にならべ、その50%のところに貧困線を引く)に「科学的根拠はない」?Koichiro Shiratori.icon
「社会参加が可能となるような生活水準」は、社会の在り方によって変化しそうyuiseki.icon
家父長制から未婚率の増加や核家族化や共働きになったら変わってしまうはず…
だんだん貧困がコンセンサスの得られない領域にryohei.icon
物価と最低賃金と生活保護と…yuiseki.icon
モノの値段が高くなっているのに貰えるお金が変わらないと貧しくなるyuiseki.icon
健康で文化的な最低限度の生活??Koichiro Shiratori.icon
一方で、人口が減っていると国家の税収は増えない…
高齢化…出生率低下…
近代を超えた自由を重視する国家の抱える課題yuiseki.icon
連帯の基盤とは
志賀信夫氏:階級、階層
ゆるいつながりもありうるのでは
お金、財政が貧困の概念の根底にある
お金以外の貧困もあるのではないか
Well-Being指標
Liveable Well-Being City 指標 β版
文化資本へのアクセスも考慮
お金だけ考えていたら解決できない問題も、他の要素に着目することで改善できる場合があるKoichiro Shiratori.icon
貧困ラインに全員が合意することがどれだけ必要なのか? たとえば民間で取り組む分には別に問題ないKoichiro Shiratori.icon
行政の一律で公平な救済が困難な時代??Koichiro Shiratori.icon
多様な貧困、多様な豊かさ
救済すべき基準としての「苦しさ」Koichiro Shiratori.icon
リチャード・ローティ『偶然性・アイロニー・連帯』
https://ja.wikipedia.org/wiki/リチャード%E3%83%BBローティ
「残酷さの回避」がリベラリズムの役割Ryohei.icon
積極的貧困と消極的貧困
積極的貧困:経済的に苦しい
消極的貧困:心が満足か、自己実現できているか
ジレンマがある
経済的な貧しさを楽しむためには文化資本が必要になる…
リテラシー
人生リテラシー?Koichiro Shiratori.icon
pha: あえて貧乏やってる、貧乏なんて怖くないぜ
足るを知る
教育
経済的に貧しいとパニックになってしまいがちyuiseki.icon
貧乏人の経済学
古代の聖人レベル……Koichiro Shiratori.icon
孔子とか…
次回予告
第4章 社会的排除理論
第5章 「自由の欠如」と現代日本の貧困問題
第6章 階層論的貧困理論と階級論的貧困理論
→現代的課題に近づく
→proj-inclusiveでいう「包摂的」とは何なのか? 達成への道筋とは?
②データ分野
Diezほか(2021)『データ分析のための統計学入門』
※レジュメ:Koichiro Shiratori.icon
第1章 データ分析への誘い
概要:データの構造、変数、および基本的なデータ収集の方法
データ=観測値
1.1 事例研究:ステントにより発作をおさえる?
統計的分析が実際問題の解決に大きな役割を演じることの例
ステント(血管内に挿入する人工的装置)処置の脳梗塞の発作への効果を検討した実験データを考察
451名の患者を2つのグループに分ける
処理群(treatment group):ステント治療+医療サービス(224名)→20%が発作を経験
対照群(control group):医療サービスのみ(227名)→8%が発作を経験
予想とは逆に、ステント処置が脳梗塞の発作を誘発する危険性が指摘できる(詳細はこれから学ぶ)
1.2 データの形式
(変数(variables):変化する値をとる概念)
参考:http://kccn.konan-u.ac.jp/sociology/research/01/1_3.html
データ行列:各行は事例(観測単位)、各列は各変数の観測値に対応
変数のタイプ
すべての変数
数値変数
連続変数
1, 1.5, 1.8, 2,...
1と2の間に無限に小数がある
離散変数
1, 2, 3, 4, 5...
飛び飛びの値
商品の売り上げ的な?
カテゴリカル変数
名目変数(非順序カテゴリカル変数)
順序変数(順序カテゴリカル変数)
変数間の関係
変数Aと変数Bが……
正の相関:Aが増えればBも増える
負の相関:Aが増えればBは減る
独立:関連がない
説明変数と目的変数
ある変数が別の変数に因果的な意味で影響すると考えられる場合、最初の変数を説明変数、他の変数を目的変数と呼ぶ
説明変数→(影響する(可能性))→目的変数
原因と結果に対応
観察研究と実験研究
統計データの収集方法には観察研究と実験研究がある
観察研究(observational study):実際に発生したデータを調べる→(※本書の立場では)変数間の関連(相関)の証拠を示すだけ
コホート研究など(追跡調査)
実験研究(experiment study):(統計的)実験、例:個体をランダムにいくつかの群に振り分け、各群に異なる処理を割り付けて、データを収集=ランダム化実験(randomized experiment)→因果関係を推測できる
1.3 サンプリングの原理と方法
母集団と標本:目標となる母集団(population)すべてを調べるのは多くの場合困難
母集団からの標本
母集団から標本(サンプル, sample)を抽出し、その標本から母集団平均の推定値が得られれば、課題の回答に有益
偏り(バイアス, bias)
観測範囲、観測問題
例:誰かが標本に入れる個体などを選ぶとすると、選者の関心が反映されて歪み(=バイアス)が生じる可能性がある
貧困問題に関心ある学生から貧困問題に関するテーマのアンケートをとっても偏りがある
→単純無作為抽出など:それでも非回答率が高いとバイアスがかかっている可能性
有意標本(便宜的な標本, convenience sample):より容易に得られる個体がデータの中に多く含まれる標本、ただしバイアスの評価は困難なことが多い
観察研究
観測データ(observational data):統計的処理が適用されていないデータ
観測データに基づく研究は、関連性を示すには十分だったり、仮説を立てるには役立つが、その結果はあとで統計的実験で検証すべき
交絡変数(confounding variable):説明変数と目的変数の両方と相関している変数
日焼け止め→皮膚ガン!?
↑太陽への露出度という交絡変数が両者に影響している可能性が高い
交絡変数をすべて見つけ出し測定するのは困難→実験が有効
前向き研究と後ろ向き研究
前向き研究(prospective study):個体を識別し、起きうる事象の情報を集めて行われる研究
実験は前向き研究
後ろ向き研究(retrospective study):事象が起きた後のデータを観察する研究(研究者が医療記録にあるデータを調べるなど)
4つのサンプリング法
①単純無作為抽出法(ランダム・サンプリング)
②層別標本抽出法(stratified sampling):母集団を分割してサンプリング
各層に属する個体が関心のある対象について類似性が高い場合に有効→推定が正確になる
③集落抽出法(クラスター法, cluster sampling)
母集団をクラスターに分け、無作為に選んだクラスターの個体をすべて調べる
④多段抽出法(multistage sample)
各クラスター内でさらに無作為抽出により標本を得る
③、④はより経済的(省コスト)、クラスター内の個体間の差が大きいときに有効、ただし分析手法はより高度なものが必要
1.4 統計的実験
実験計画の原理
管理:群内の違いをできるだけ制御(control)
ランダム化:管理できない変数の影響を無作為割り付けで相殺
繰り返し:繰り返しでより多くの事例を観察できる
ブロック化(局所化):個体をグループ化してブロックをつくることで、処理変数と別の変数の影響も推測
統計的実験のバイアス削減法
薬の効果ではない心理的効果によるバイアスの可能性
→二重盲検法(double-blind):患者と医師・研究者がともにどの患者が処置を受けているかわからないようにする(※常に可能とは限らない)
参加者の質問・感想・コメント
介入したことによって悪くなってる可能性は医学史において頻繁にあるyuiseki.icon
医原病
瀉血
ランダム化比較試験しないとわからない
貧困問題に対してランダム化比較試験した事例集:貧乏人の経済学
有意な相関を見出すことと比べると、因果関係の特定はメチャクチャ難しいyuiseki.icon
因果関係の推論は、統計学の最先端
統計的因果推論
https://ja.wikipedia.org/wiki/統計的因果推論
RCTなどで短期的な因果関係は測定できても、統計的に測定が難しいような長期的な効果を測るのは難しい・・・Ryohei.icon
第2章 統計データの記述
概要:データの要約法、グラフ、ランダム性を用いた推測の必要性
2.1 数値データの記述
2次元データの散布図
ドット・プロットと平均
ヒストグラムと頻度分布の形
分散と標準偏差
データのばらつき(変動性)も重要
※偏差:各観測値から平均までの距離(偏差=観測値-平均)
標本分散(s2):偏差を二乗して平均をとる(ただしn-1で割る)
標準偏差:分散の平方根
平均から観察値が典型的にはどの程度乖離しているかを表現
通常はデータの約70%は平均からの1標準偏差内、約90%は2標準偏差内にある(厳密なルールではない)
※母集団の分散と標準偏差にはそれぞれσ2(シグマ)、σが用いられる
箱ひげ図、分位点、中位数(中央値)
中央値とIQR(四分位範囲)
頑健な統計量
中央値とIQRは頑健統計量
平均と標準偏差は極端な観察値にかなりの影響を受けるが、状況によってはそのことに重要な意味がありうる
所得の平均値は億万長者の影響を受けてしまうyuiseki.icon
地球人の戦闘力の平均にフリーザ様が混ざった的な・・・Ryohei.icon
データ変換
データ変換:データをある関数を利用してスケールを変更すること
例:対数変換、平方根変換、逆数変換
データ構造を異なる眼で眺めることで歪みを減らし、統計的モデリングを容易にしたり、散布図上での非線形な関係を線形化するなど
データのマッピング
2.2 カテゴリカル・データ
分割表と棒グラフ
行比と列比
2変数と棒グラフ(バー・プロット)
モザイク・プロット
(本書で唯一の)円グラフ
円グラフは有用ではあるが、群データを比較する場合などは棒グラフのほうがよいだろう
数値データの群間比較
2.3 事例研究:マラリア・ワクチン
データ内の変動性
あるマラリアワクチンが有効かどうか
14名の被験者のうち、処理群の35.7%が感染、対照群の100%が感染(感染率の差は64.3%)
しかし、標本誤差(random noise)があるので、ワクチンが有効とすぐには結論づけられない
シミュレーション研究
ワクチンが感染に何も影響しないと仮定し、2つの群の被験者にランダムに「感染」「非感染」のカードを渡す→数多く繰り返して感染率の差の分布を調べる
独立性を調べる
100回のシミュレーション中、64.3%程度の差が出るのは2回→常に正しい答えがわかるわけではないが、誤る可能性を制御、評価できる
参加者の質問・感想・コメント
シミュレーション研究、興味深いyuiseki.icon
コンピューターシミュレーションでもできるらしい
めったに起きない事象かどうか?
情報、情報量→計算機科学や情報科学につながっている
https://ja.wikipedia.org/wiki/情報量
情報量やエントロピーは、情報理論の概念で、あるできごとが起きた際、それがどれほど起こりにくいかを表す尺度である。ありふれたできごとが起こったことを知ってもそれはたいした「情報」にはならないが、逆に珍しいできごとが起これば、それはより多くの「情報」を含んでいると考えられる。
100回のシミュレーション中、64.3%程度の差が出るのは2回……
2%の確率で偶然……
偶然では片付けられない……
※まだ有意という概念は出てきていない
次回予告
第3章 確率
第4章 確率変数の分布
③プログラミング分野
OpenFiscaによるRule as Codeで誰一人取り残さない社会を一緒に実現しよう!
Q&A
初学者です。どのプログラミング言語を勉強したらいい?
複数のプログラミング言語に触れて用途に応じて使い分けるのがオススメyuiseki.icon
共通点とか違う点
オススメの本:コーディングを支える技術
そもそもなぜプログラミング言語はこんなにたくさんあるのか?ということがわかる
プログラミング概念史になっている
Dockerって何? なんでインストールするの?
https://www.docker.com/resources/what-container/
Package Software into Standardized Units for Development, Shipment and Deployment
ソフトウェアの開発・出荷・展開のための標準化されたユニットへのパッケージ化
Dockerが無かったらソフトウェアの開発・出荷・展開のための標準化されたユニットが無い状態
オススメの本:プログラマのためのDocker教科書
Docker、Linux、仮想化技術などが元になっている
WSLって何??
Windows Subsystem for Linux
Windows上でLinux OSを無理矢理動かすためにMicrosoftが開発した仕組み
macOSを使ってたら不要
macOSはPOSIX系のOSで、Linuxと共通点が多い
WindowsはPOSIXとあまりにも別物すぎる
Windowsの上にPOSIXのレイヤーを作ってLinuxを動かす
PowerShellって??
Windowsのシェル
OSのカーネル(核)と通信するための殻
https://gyazo.com/cde96a22e730bac187450ddbca44b77c
コマンドプロンプトとは別
macOSを使ってたら不要
Ubuntuって??
Linuxの定番ディストリビューションのひとつ
https://ja.wikipedia.org/wiki/Ubuntu
Ubuntu(ウブントゥ6、ʊˈbʊntuː ( 音声ファイル); oo-BOON-too7)はDebian GNU/Linuxを母体としたオペレーティングシステム(OS)である。Linuxディストリビューションの1つであり、フリーソフトウェアとして提供されている。概念はディストリビューションも参照。カノニカルから支援を受けて開発されている。開発目標は「誰にでも使いやすい最新かつ安定したOS」を提供することである。
ディストリビューションって何?
Linuxとは、カーネルの名前
カーネルだけではOSとして動かせないので、OSとして動かせるようにいろんなソフトウェアをひとまとめにしたものがディストリビューション
Dev Containerって??
Visual Studio CodeでDockerを使って開発環境を統一するための仕組み
Visual Studio Code、導入すると何ができる??
Microsoftが開発した
WindowsでもmacOSでもLinuxでも動きます
Visual Studio CodeはIDE(統合開発環境)のひとつ
ファイルの編集
コードの実行、デバッグ
シェルとの統合
Jupyter Notebookの実行
Dev Containerによって提供されるDockerイメージ内での開発
エディタにもいろいろある…
atom
さくらエディタ
Eclipse
Linuxで貧弱な環境でも動くエディタ
nano
ed
vim
emacs
ipynb形式のファイル=Jupyter Notebook
Pythonのコードをブロックごとに書ける、実行できる、という仕組み
次回:9月11日(日)18:00-
レジュメ分担
貧困理論入門Ryohei.icon
第4章 社会的排除理論
第5章 「自由の欠如」と現代日本の貧困問題
第6章 階層論的貧困理論と階級論的貧困理論
データ分析のための統計学入門yuiseki.icon
第3章 確率
第4章 確率変数の分布
コーディングを支える技術Koichiro Shiratori.icon
第1章 言語を深く効率的に学ぶには
第2章 プログラミング言語を俯瞰する